AIと声を使って何ができる?

 Q AI(人工知能)は私たちの声をどこまで理解できる?

 A 話し声から内容を文章として読み取る「音声認識AI」は、実用化が進んでいる分野だ。話しかけると意味をくんで音声で返答する米アップルのアプリ「Siri(シリ)」は、10年以上前から使われている。人間のように自然な文章をつくる生成AIと組み合わせることもでき、米オープンAIのChatGPT(チャットGPT)の最新版は、AIとアドリブでの自由な音声会話を楽しめる。コールセンター業務などで活用が広がると考えられている。

 Q AIを使えば、自分の声を再現できる?

 A 「話者ベクトル」と呼ばれる個人の声の特徴(とくちょう)について研究が進み、数秒程度の話し声のデータがあれば声色を再現できる「ボイスクローン」技術が格段に進化している。病気や手術で声を失った人に向けて、以前の録音から自分の声色を再現して発声できるソフトなどが実用化されている。実際にはしゃべれない外国語を、自分の声色で流暢(りゅうちょう)に話す音声もつくれる。

 Q 便利だね…

共有